Extraction de biclusters à valeurs similaires avec l’analyse de concepts triadiques
نویسندگان
چکیده
Biclustering numerical data became a popular datamining task in the beginning of 2000’s, especially for analysing gene expression data. A bicluster reflects a strong association between a subset of objects and a subset of attributes in a numerical object/attribute data-table. So called biclusters of similar values can be thought as maximal sub-tables with close values. Only few methods address a complete, correct and non redundant enumeration of such patterns, which is a well-known intractable problem, while no formal framework exists. In this paper, we introduce important links between biclustering and formal concept analysis. More specifically, we originally show that Triadic Concept Analysis (TCA), provides a nice mathematical framework for biclustering with a better algorithmic scalability over existing methods.
منابع مشابه
Caractérisation et extraction de biclusters de valeurs similaires avec l'analyse de concepts triadiques
Résumé. Le biclustering de données numériques est devenu depuis le début des années 2000 une tâche importante d’analyse de données, particulièrement pour l’étude de données biologiques d’expression de gènes. Un bicluster représente une association forte entre un ensemble d’objets et un ensemble d’attributs dans une table de données numériques. Les biclusters de valeurs similaires peuvent être v...
متن کاملBiclustering of Gene Expression Data Based on Local Nearness
Résumé. L’analyse des données d’expression de génes dans les fragments d’ADN est un outil important utilisé dans la recherche genomique dont les objectifs principaux s’étendent de l’étude du caractére fonctionnel des génes spécifiques et leur participation dans les processus biologiques à la reconstruction de conditions des maladies et leur pronostique. Les données d’expression des génes sont a...
متن کاملExtraction de Règles en Incertain par la Méthode Implicative
Résumé. En relation avec des approches classiques de l’incertain, l’analyse statistique implicative (A.S.I.) peut apparaître innovante, particulièrement pour l’opérateur d’implication. L’article montre en effet que la notion de variables à valeurs intervalles et celle de variables-intervalles sont efficaces dans la détermination de leur distribution et dans la recherche de règles entre variable...
متن کاملKhiops: outil d'apprentissage supervisé automatique pour la fouille de grandes bases de données multi-tables
Résumé. Khiops est un outil d’apprentissage supervisé automatique pour la fouille de grandes bases de données multi-tables. L’importance prédictive des variables est évaluée au moyen de modèles de discrétisation dans le cas numérique et de groupement de valeurs dans le cas catégoriel. Dans le cas d’une base multi-tables, par exemple des clients avec leurs achats, une table d’analyse individus ×...
متن کاملIntégration interactive de contraintes pour la réduction de dimensions et la visualisation
Résumé. Il existe aujourd’hui de nombreuses méthodes de réduction de dimensions, que ce soit dans un cadre supervisé ou non supervisé. L’un des intérêts de ces méthodes est de pouvoir visualiser les données, avec pour objectif que les objets qui apparaissent "visuellement" proches soient similaires, dans un sens qui correspond aux connaissances d’un expert du domaine ou qui soit conforme aux in...
متن کامل